摘要: 针对现有语音增强方法对图谱特征关联信息表达有限和去噪效果不理想的问题,提出一种双复数卷积注意聚合递归网络(DCCARN)。首先,建立双复数卷积网络,对短时傅里叶变换后的语谱图特征分别进行两分支信息编码;其次,将两分支中编码分别用特征块间和块内注意力机制对不同的语音特征信息进行重标注;然后,经长短期记忆(LSTM)处理长时间序列信息,再经两解码器还原语谱特征并将特征聚合;最后,经短时逆傅里叶变换生成目标语音波形,达到抑制噪声目的。在公开数据集VBD和加噪的TIMIT数据集上分别进行实验,结果表明,与相位感知的深度复数卷积递归网路(DCCRN)相比,DCCARN在客观语音质量评估(PESQ)上分别提升了5.597%和2.672%。验证了所提方法能更准确地捕获图谱特征上的关联信息并更有效抑制噪声和增强语音清晰度。
中图分类号: